T-检验，Z-检验，F-检验，卡方检验

未完待续

为什么需要检验

在实际的测试环境中，我们不可能对全部的总体每一个都拿出来检测，只能从中取部分来进行检验，检验就是「以小搏大」的过程，通过一些样本来估计总体的情况

以检验“一个新药是否能改变血压”为例：

原假设 $H_{0}$ ：新药没有效果（比如总体均值 = μ₀）
备择假设 $H_{1}$ ：新药有效（总体均值 ≠ μ₀）

我们从人群中随机抽取样本，计算出样本均值 $\bar{x}$ ，我们要问的是：

如果 $H_{0}$ 是真的，这样一个样本均值是“合理”的吗？还是太极端了以至于我们不得不怀疑 $H_{0}$ 的真实性

进入正态分布

引入中心极限定理（CLT）

中心极限定理能帮助我们将原本总体并不符合正态分布的样本变为正态分布的数据：

当样本量 n 足够大时，样本均值 $\bar{x}$ 的分布近似服从正态分布，即使原始数据不是正态的

依赖于中心极限定理，我们可以从将一般的数据变为符合正态分布的数据

多次抽样后趋向于正态分布

但是一般正态分布并不利于我们的研究，我们需要更特殊的正态分布，便于我们查表和概率统计，而且标准正态分布是已经被彻底研究和广泛应用的数学工具，我们将一般变为特殊，也方便我们进行研究

Z 变换

Z 变换解决了将一般的正态分布转换为标准正态分布的问题，其转换公式为：

Z = \frac{x - μ}{σ}

其中 $x$ 为单个数据， $μ$ 为前面取到总体的平均值， $σ$ 为总体的方差

假设某次考试服从正态分布，均值 $μ = 70$ ，标准差 $σ = 10$ ，某学生成绩 $x = 85$ ，那么将其映射到标准的正态分布上 $Z$ 的数值为：

Z = \frac{85 - 70}{10} = 1.5

从一般正态分布变为标准正态分布

总结

中心极限定理，Z 变换解决的问题是：将一般的数据变为正态分布的数据，再将一般的正态分布变为标准正态分布

如果：

$x_{1}, x_{2, \dots}, x_{n}$ 是独立同分布的随机变量
每个变量都有自己独立的期望和方差 $σ^{2}$

那么样本均值：

\bar{x_{n}} = \frac{1}{n} \sum_{i = 1}^{n} x_{i}

其标准化形式为：

Z = \frac{\bar{x_{n}} - μ}{σ / \sqrt{n}}

检验

假设检验

为什么需要假设检验

在研究中只能对样本进行抽样，使用抽样后的结果反映总体（以小搏大）

做出检验的基本步骤

做出零假设： $H_{0} : μ = μ_{0}$
选择备择假设：
- $H_{A} : μ > μ_{0}$ ，若已知值大于总体均值（最大...）
- $H_{A} : μ < μ_{0}$ ：若已知值小于总体均值（最小...）
- $H_{A} : μ \neq μ$ ：检查有无变化，不关心方向前面两种都是单尾检验，最后一种是双尾检验
检验过程：
- 选择总体的正态分布
- 取样得到 $\bar{x}$
- 计算得到 $s$ （样本方差）
确定显著性水平（ $α$ ）
确定图像：从显著性水平的值 $α$ 的值去寻找对应标准正态分布上的 $x$ 值（临界值）
取 sample，然后根据所算得的值与前面的临界值做比较

Z = \frac{\bar{x} - μ}{σ / \sqrt{n}}

下结论：
- 拒绝，如果算出来的 $Z$ 在临界值外，则拒绝掉零假设，此时犯 Type One Error，需要说明犯错误的风险为 $α$
- 接受，如果算出来的 $Z$ 在临界值内，则接受零假设，此时犯 Type Two Error，此时不需要指出犯错误的风险

假设检验的两种错误

Type I Error

原假设 $H_{0}$ 是真的情况下，错误的拒绝掉了（ $H_{0}$ 是对的，但却被冤枉错了）

其概率记为： $α$ （显著性水平）

Type II Error

原假设 $H_{0}$ 是错误的情况下，错误的接受了（ $H_{0}$ 是错的，但却被接受了）

概率记为： $β$ （无法计算）

Z 检验（单样本的 Z 检验）

核心思路

将样本统计量转换为 Z 值，然后根据标准正态分布判断观察到的结果出现的概率，从而决定是否拒绝原假设

适用条件

条件	说明
1. 数据服从正态分布	或样本量足够大（中心极限定理保证近似正态）
2. 已知总体标准差	这是Z检验与t检验的关键区别
3. 样本量通常较大	通常 $n \geq 30$ 时更适合用Z检验

统计量

Z 统计量：

Z = \frac{\bar{x} - μ}{σ / \sqrt{n}}

自由度：

d f = n

其中参数为：

$\bar{x}$ ：样本平均数
$μ$ ：总体平均数
$σ$ ：总体方差
$n$ ：样本容量

举例

你想知道某品牌手机的平均续航时间是否为 10 小时（厂商所说的），在显著性水平 $α = 0.05$ 的情况下判断说的对不对

原假设 $H_{0}$ : 手机的平均续航时间是 10 小时
备择假设 $H_{1}$ : 手机的平均续航时间不是 10 小时

你抽取 100 部手机，得到样本均值 9.7 小时，总体标准差已知为 1.5 小时。

Z = \frac{9.7 - 10}{1.5 / \sqrt{100}} = \frac{- 0.3}{0.15} = - 2.0

此时由于是判断说的对不对，应当使用双尾检验，那么两侧分别的显著性水平则为 $α = 0.025$ ，然后去查表，看看临界值在哪里，最后进行判断

单样本的T 检验 - Z 检验的推广（使用样本标准差 $s$ 代替总体标准差 $σ$ ）

核心思路

要估计总体均值 $μ$ ，但不知道总体标准差 $σ$ ，只能使用样本标准差 $s$ 来估计，此时无法使用 Z 检验

此时可以使用样本的标准差来代替总体标准差，即 T 检验

适用条件

条件	要求
数据近似正态分布	或样本量足够大可用中心极限定理
未知总体标准差	使用样本标准差来估计
样本独立	各样本值之间相互独立

统计量

T 统计量：

t = \frac{\bar{x} - μ}{s / \sqrt{n}}

自由度：这里的自由度降低 1 可以理解为使用 $s$ 来代替 $σ$ 进行估计，消耗了一个自由度

d f = n - 1

其中参数为：

$\bar{x}$ ：样本的平均数
$μ$ ：总体平均值
$s$ ：样本标准差
$n$ ：样本容量

举例

一种药品声称能将血压降低 10 单位，你随机抽取 15 人使用后记录平均下降为 8 单位，标准差为 3 单位。是否有统计证据说明药效不如宣传？

$\bar{X} = 8$
$μ_{0} = 10$
$s = 3$
$n = 15$

t = \frac{8 - 10}{3 / \sqrt{15}} = \frac{- 2}{0.7746} \approx - 2.58

这里就要使用单尾检验，因为说了是要求降低 10 单位，所以使用左尾进行检验，但 $d f = 15 - 1 = 14$ 的时候，显著性 $α = 0.05$ 的时候，左尾的拒绝域为 $t < - 2.145$

故此时样本的 $t$ 统计量在拒绝域里面，所以要拒绝，我们认为药效要低于 10 单位

配对样本的 T 检验 - 单样本 T 检验的推广

核心思路

用于比较同一组对象在两个不同条件下的均值差异（治疗/服药/运动前后）

何时使用配对 T 检验

数据成对出现
每对数据的差值 $d = x_{后} - x_{前}$ 服从正态分布
连续性数据

检验统计量

t = \frac{\bar{d} - μ_{d o}}{S_{d} / \sqrt{n}}

$\bar{d}$ ：差值的平均值
$S_{d}$ ：差值的标准差
$n$ ：配对数（不是 object 的数量）

检验过程

比如说要检验一组病人服药前后的对比

病人	服药前	服药后	d
1	140	130	10
2	150	142	8
...	...	...	...
10	145	135	10

此时需要将每一对病人前后的服药情况绑定为一组，然后进行计算

T-检验，Z-检验，F-检验，卡方检验 ​

为什么需要检验 ​

进入正态分布 ​

引入中心极限定理（CLT） ​

Z 变换 ​

总结 ​

检验 ​

假设检验 ​

为什么需要假设检验 ​

做出检验的基本步骤 ​

假设检验的两种错误 ​

Z 检验（单样本的 Z 检验） ​

核心思路 ​

适用条件 ​

统计量 ​

举例 ​

单样本的T 检验 - Z 检验的推广（使用样本标准差 s 代替总体标准差 σ） ​

核心思路 ​

适用条件 ​

统计量 ​

举例 ​

配对样本的 T 检验 - 单样本 T 检验的推广 ​

核心思路 ​

何时使用配对 T 检验 ​

检验统计量 ​

检验过程 ​

​

T-检验，Z-检验，F-检验，卡方检验

为什么需要检验

进入正态分布

引入中心极限定理（CLT）

Z 变换

总结

检验

假设检验

为什么需要假设检验

做出检验的基本步骤

假设检验的两种错误

Z 检验（单样本的 Z 检验）

核心思路

适用条件

统计量

举例

单样本的T 检验 - Z 检验的推广（使用样本标准差 $s$ 代替总体标准差 $σ$ ）

核心思路

适用条件

统计量

举例

配对样本的 T 检验 - 单样本 T 检验的推广

核心思路

何时使用配对 T 检验

检验统计量

检验过程